豆瓣的 5 分评价系统和 Steam 的推荐度评价系统,我们该怎样选择?
5 分制评价系统和 “推荐/不推荐” 的评价系统,各自的利弊是什么?
比如豆瓣,tap,点评都是 5 分制。
steam,jump 则是推荐/不推荐,最终落到 “xx% 用户推荐” 这个推荐率上面。
简单的理解是,5 分制的颗粒度更细,不同综合分之间的对比度更强,更适合建设一个有公信力的榜单。而推荐/不推荐,在用户侧的思考成本更低,容易拿到更大的参与样本。
功能设计上,如纯银所说,选项少、成本低、行为样本数高。如果业务目标里,不强调榜单、排名的场景,就不需要设计更复杂的评分系统——够用就行。
生活中最直接的例子是:
普通大学考试 ABCD 评级,学生知道自己在什么段位即可 雅思作为语言能力考试,满分 9 分、0.5 分一档,通畅 6.5 足够证明基础语言能力 GRE 研究生入学考试,满分 340 分、一分一档,因为高校需要优中选优
从上到下,获得更准确的排名,是需要额外支付成本的。
回到产品设计,几个有代表性的例子:
细致评分制度:Amazon 五星、豆瓣五星、IMDb(直接用了 10 分制) 推荐 / 不推荐:Steam、什么值得买(值 / 不值)
前者,用户通过「得分」来判断,能直接对比排名,非常直观。但维护得分公信力也需要支付高成本—— IMDb 的得分基础是贝叶斯算法,同时还要考虑用户特征的影响(新注册、刷榜、资深观影用户等)。从用户视角看,评分的操作成本高一点点,准确性也会有影响。
后者,用户通过「推荐值」来判断,如果不需要横向对比,也同样直观——这件商品在 smzdm 有 82% 的人点了值,我高低得点进去看看。
这里还引申出一个上层问题,从业务目标出发,希望通过评价系统「让用户获得什么、做什么」。对于大部分平台,无非是帮助用户完成消费决策。在这个目标下,排名和榜单也只是方法之一,尤其在有强大推荐算法加持的当下——毕竟在大部分场景下,给我最好的,不如给我最适合的。也聊两个有代表性的例子:
微信读书:推荐 / 一般 / 不行——用户通过推荐值百分比来判断
Netflix:超赞 / 喜欢 / 不合胃口——用户通过「 xx% 适合你」来判断
尤其 Netflix ,强调通过「适不适合」做主线推荐:如果你盛赞《绝命毒师》,一定会把《风骚律师》通过各种方式砸你脸上,然后见缝插针地让你看《黑钱胜地》和《苏里南》——都是通过「 96% 适合你」这种推荐理由。至于其他热剧,再通过其他运营手段(热榜、标签)推荐给你。
补一个交易产品的视角:滴滴的司机评分。
内容来自“用思考交换思考”的 PM 思辨社区「犬校」。©2017-2022
点击“阅读原文”,查看犬校加入方式。